【アンケートデータ可視化】可視化してみた〜Looker Studio編〜
データアナリティクス事業本部の武田です。
今日は、ブログリレー企画の「アンケートデータを可視化してみた〜Looker Studio編〜」です。
BIチームでは、アンケートデータの可視化をテーマにブログリレーを行っています。
アンケートデータを題材に、よくある可視化パターンの作り方をLooker Studioを使ってご説明します。
Looker Studioとは
Looker Studioとは、Googleが提供しているセルフBIサービスです。 少し前まで、「データポータル」という名前でした。
DBだけではなく、CSVやスプレッドシードからもデータ取込が可能です。 Googleのアカウントがあれば、無料で使うことができます。
基礎的な使い方は、下記にまとまっています。
データ準備
対象データは大手町・丸の内・有楽町(OMY)データライブラリのオープンデータの中から、アンケートデータを使用します。
【2020年度】丸の内仲通りにおける自動運転バス実証実験のアンケート結果(試乗体験者)
【2020年度】丸の内仲通りにおける自動運転バス実証実験のアンケート結果(歩行者)
上記データを下記のように加工してから取り込んでいます。
加工については、ブログリレー企画のデータ加工編でご確認ください。
この実証実験の事業概要は、大丸有スマートシティプロジェクト リ・デザイン実証事業概要に纏まっています。
Looker Studioでの可視化の流れ
Looker Studioでの可視化は、下記3つのステップで行います。
- 1.データを取り込む
- 2.計算フィールド追加(必要な場合)
- 3.可視化する
データを取り込む際、もし複数ファイルの結合が必要であれば、Looker Studioの中で統合という機能を使って結合することができます。ただし、統合には以下の制限があります。
・統合できるテーブル数は5つまで ・統合できるディメンションは1テーブルにつき10個まで ・統合後に計算フィールドを追加することはできない(計算フィールドの追加は統合前に準備する)
この制限を回避したい場合は、DB側でビュー等を使って準備し、その結果をLooker Studioへ取り込むことになります。
今日説明するグラフのパターンは、下記5つです。
上記パターンは、アンケート回答者属性を可視化する際に使っています。
また、属性以外のデータの可視化として、単一回答、複数回答、自由回答の3パターンについても紹介します。
データを取り込む
では早速データをLooker Studioに取り込みます。
メニューの中の「データを追加」をクリックします。
コネクタがたくさん選べます。今回はCSVなので、「ファイルのアップロード」から取り込みます。
ファイルを選択してアップロードします。 アップロードが終了したら、右上の「フィールド」をクリックすると、計算フィールドやデータ型の編集画面へ進みます。
計算フィールド追加
フィールドの編集画面で、データ型を見直したり、計算フィールドを編集できます。計算フィールドを追加するときは右上の「フィールドを追加」をクリックします。
今回の場合は、データ加工であらかじめ計算不要な状態に加工済みでしたので、計算フィールドの追加はありませんが、必要に応じて作成します。たとえば、数量と単価を掛け算した結果の列を持つといったことができます。
データの準備ができましたので、可視化に進みます。
回答者の属性を可視化する
回答者の属性というのは、例えば、性別・年齢・職業等のことです。 属性の項目に合わせて、このように可視化してみました。
上記は5つのグラフでできています。
①数値カード
アンケートの回答者数を表示するために使っています。数字を大きく表示したい場合に使う表現方法です。
上記の設定はこちらです。回答者数は、個別件数をカウントしています。
②ドーナツグラフ
割合(構成比)を表示するために使っています。全体の中でどれくらいを占めるかを伝えたい場合に使う表現方法です。円グラフとの違いは、真ん中に空白があるところです。このスペースに、カードで作った全体数量(合計)を配置することもできます。
上記の設定はこちらです。
ラベルやツールチップに何を出すか(件数を出すのか構成比を出すのか)は選択できますが、両方出すとか凡例も出すといったことを編集できる機能はありません。 また、ドーナツの真ん中に合計値を出したい場合は、数値カードを作って上から重ねることになります。
③円グラフ
割合(構成比)を表示するために使っています。全体の中でどれくらいを占めるかを伝えたい場合に使う表現方法です。円グラフの場合に注意したいのは、分類が多い場合に大きさ(角度)を比較することが難しくなることです。性別等で分類パターンが2−3個しかない場合はわかりやすいのですが、数が増えてくると比較が難しくなります。
上記の設定はこちらです。
設定はドーナツグラフと同じです。 ドーナツグラフと同様、ラベルやツールチップに何を出すか(件数を出すのか構成比を出すのか)は選択できますが、両方出すとか凡例も出すといったことを編集できる機能はありません。
④棒グラフ
年齢別の人数を表現するのに使っています。項目別の比較や時系列での変化を見るのに使う表現方法です。
上記の設定はこちらです。
本当は棒を1本にして、年代ごとに色分けするというグラフを描きたかったのですが、システムエラーを起こしてしまい、実現することができませんでした。 棒が複数の場合は可能なのですが、1本にはできないのかもしれません。実現方法がわかったら更新したいと思います。
⑤ツリーマップ
上記の設定はこちらです。
回答選択肢が複数あるものの構成比を見たい時に使うツリーマップです。 ドーナツグラフや円グラフは、回答選択肢が2−3個までだと見やすいのですが、それ以上になると分かりにくくなるため、ツリーマップを使います。
単一回答を可視化する
アンケート回答そのものを可視化していきます。 まずは「単一回答」のものだけを可視化してみました。
利用頻度については、本当は下記のような棒を1本にして色分けするという横棒グラフを描きたかったのですが、システムエラーを起こしてしまい、実現することができませんでした。棒が複数の場合は可能なのですが、1本にはできないのかもしれません。実現方法がわかったら更新したいと思います。
下記はTableauで作成したものです。こんなイメージの横棒グラフを作ろうとしていました。
この調査は今後の課題です。(縦棒グラフでも同じエラーが発生します。)
他のグラフで良い見せ方がないかと思って、利用頻度を円グラフにしてみましたが、選択肢が多いために、どの色がどの回答の結果なのかをパッと見て判断することは難しくなってしまいました。また、角度の違いが微妙だと大小関係を直感的につかむことも難しいので、円グラフは不向きでした。
利用頻度のような選択肢が多めのものは、ツリーマップにするか、1本の積み上げ横棒グラフで中に凡例もラベルに表示するのが分かりやすくなると思います。
複数回答を可視化する
次に「複数回答」を可視化します。 複数回答ということは、一人がたくさんの選択肢にチェックすることができるということです。
2個チェックした人もいれば5個チェックする人もいる状態なので、回答されたものを合計すると、合計人数よりも大きくなる可能性があります。
円グラフでいうと、円そのものの大きさが変わることになるイメージです。
構成比を見るようなグラフを選んでしまうと、1つの選択肢の重みが変わってしまいます。 ですので、純粋に件数を横並びに可視化してランキングしました。
自由回答(フリー入力)を可視化する
下記のような一覧表で、自由解答の中身が確認できます。例えば、属性で20代の方が答えたもののみにフィルタする等も可能です。
やりたかったがLooker Studioではできなかったこと
凡例、ツールチップ、ラベルの詳細設定
凡例の並び替え、ツールチップの細かな設定、ラベルの細かな設定はできませんでした。例えば、ラベルに「性別、人数、構成比」を全て表示したいと思っても、そういった設定はできません。どれか一つだけの表示になります。
1本だけの積み上げ横棒グラフ
下記のように色分けされた積み上げ横棒グラフを作ることができませんでした。
このエラーが出てしまったため、代わりに一覧表と棒グラフで可視化しました。
ふりかえり
ラベルやツールチップの細かな設定はできないものの、ささっと表現することは可能でした。Looker StudioはセルフBIとして開発されており、スプレッドシートやCSV等の手元のデータを使った可視化が可能です。
一部システムエラーが起きてしまうグラフタイプがあったので、その調査は今後の課題として残りましたが、無料でシンプルな操作でここまでできるということがわかりました。